Pandas 库的数据索引与选取

本节将向大家介绍运用 Pandas 库对 Python 中的数据进行索引与选取的一系列常用方法。为了更好地演示具体的操作,首先我们需要导入 Pandas 库,并运用 Pandas 中的 Series 函数构造一个 Pandas 序列作为示例数据:


In [13]:
import pandas as pd
data = pd.Series([0.25, 0.5, 0.75, 1.0],
                 index=['a', 'b', 'c', 'd'])
data


Out[13]:
a    0.25
b    0.50
c    0.75
d    1.00
dtype: float64

序列单值索引与赋值

在前几节中我们曾向大家介绍过 Pandas 序列数据的简单索引方法,我们可以使用方括号加索引值的形式查看序号对应的数据内容:


In [14]:
data['b']


Out[14]:
0.5

同时,我们可以利用 in 语法来检查指定的序号是否存在:


In [15]:
'a' in data


Out[15]:
True

对于 Pandas 序列,我们还可以通过查看 keys 属性来确认所有的序号名称:


In [16]:
data.keys()


Out[16]:
Index([u'a', u'b', u'c', u'd'], dtype='object')

如果我们使用 list 函数将 Pandas 序列的 items 属性转化为列表的话,那么该列表将有如下所示的数组形式组成:


In [17]:
list(data.iteritems())


Out[17]:
[('a', 0.25), ('b', 0.5), ('c', 0.75), ('d', 1.0)]

使用等号可以对指定位置的元素进行赋值:


In [18]:
data['e'] = 1.25
data


Out[18]:
a    0.25
b    0.50
c    0.75
d    1.00
e    1.25
dtype: float64